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Resumen 


Inicialmente se exponen conceptos generales sobre el análisis regional de frecuencia 
de crecientes. Enseguida se describe con detalle la prueba de Discordancia para 
detectar registros con datos anómalos y, por lo tanto, discordantes con el resto. A 


continuación se expone la prueba H de heterogeneidad, basada en la simulación 
de 500 regiones homogéneas, y el test de Wiltshire, el cual utiliza el coeficiente 
de variación local y regional para establecer un estadístico con distribución p?. 


Posteriormente se aplican las tres pruebas estadísticas citadas en cuatro regiones 


originalmente aceptadas como homogéneas y se analizan sus resultados. Por 


último se formulan las conclusiones, las cuales sugieren la aplicación sistemática 
de las tres pruebas para decidir sobre la homogeneidad de la región estudiada. 


Palabras clave: momentos L, discordancia, simulación, prueba H, test de Wiltshire. 


Introducción 


De manera general, los eventos hidrológicos 
extremos de la naturaleza, como crecientes, 
sequías, tormentas severas y vientos fuertes 
causan daños en la sociedad. Por ello, estimar 
con cierta precisión qué tan frecuente es un 
evento de determinada magnitud es de enorme 
importancia; sin embargo, la estimación proba- 
bilística de tales eventos extremos es bastante 
difícil, pues por definición son raros y sus 
registros disponibles cortos (Hosking y Wallis, 
1097) 

El análisis regional 
(ARFC) 
“comerciando espacio por tiempo”, ya que 


de frecuencia de 
crecientes enfrenta el problema 
los datos de varios sitios son utilizados para 
estimar los eventos extremos de una localidad 
en particular. Este enfoque es válido debido a 
que las muestras de crecientes utilizadas son 
típicamente observaciones de la misma variable 
en un número determinado de sitios de medición 
dentro de una región apropiadamente definida. 
El término región sugiere una serie de 
sitios aledaños; sin embargo, la cercanía 


geográfica no necesariamente es un indicador 
de similaridad, por ejemplo, en la función 
de distribución de probabilidades (FDP). 
Entonces resulta razonable identificar regiones 
midiendo en cada sitio variables que tienen 
influencia en la FDP y después agrupar sitios 
que muestran características similares. Tales 
variables son de dos tipos: las asociadas con 
la cuenca (área, altitud media, lluvia anual o 
puntual, etcétera) y las relativas al registro 
de crecientes, como son sus propiedades 
estadísticas. Por ello, tanto para la integración 
de las regiones homogéneas como para su 
verificación se han formulado diversos 
procedimientos y pruebas estadísticas. 

Ya que todo ARFC comienza con la revisión 
de los datos, este trabajo inicia describiendo 
con detalle la prueba estadística de Discor- 
dancia, la cual está basada en los momentos L y 
permite detectarregistros anómalos. Enseguida 
se describen con sus pormenores las otras 
dos pruebas estadísticas de homogeneidad 
regional, la primera basada en simulación y la 
segunda en la dispersión de los coeficientes de 
variación. 
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Las tres pruebas estadísticas se aplican 
en cuatro regiones de México que han sido 
consideradas homogéneas para realizar 
diversos análisis hidrológicos, como son 
predicciones de crecientes, del volumen de 
sedimentos en cuencas sin aforos y de la 
precipitación máxima diaria. Como resultado 
de estas aplicaciones y de otras más que no 
fueron descritas por razones de espacio, se 
formulan dos conclusiones que recomiendan 
la aplicación sistemática de las pruebas 
descritas, para verificar la homogeneidad 
regional, antes de proceder con las técnicas 
del ARFC, basadas en conjunción de datos y 


ponderación de parámetros estadísticos. 
Procedimientos 
Revisión de los datos 


En el inicio de todo ARFC, al menos se deben 
realizar las siguientes dos verificaciones: 
(1) cada muestra o serie de datos de un 
sitio debe ser revisada para buscar datos 
erróneos; es decir, valores demasiado grandes 
o extremadamente reducidos, así como 
repetidos, los cuales se pudieron originar en 
la transcripción; (2) se deben buscar tenden- 
cias en cada serie y comparar las muestras 
entre ellas y con las más cercanas. Además, 
los datos deben mostrar una “evolución” o 
cambio en magnitud, por ejemplo conforme el 
tamaño de la cuenca crece o su ubicación varía 
de una zona a otra de la región analizada. 

Afortunadamente, los valores erróneos, 
los eventos dispersos (outliers), la tendencia, 
y los saltos o cambios en la media de los 
datos son reflejados en los momentos L de 
la muestra (ver apéndice). Por ello, una 
mezcla conveniente de los cocientes L en un 
solo estadístico (D) que mida la discordancia 
entre los cocientes L del sitio y los promedio 
de grupo se ha sugerido como prueba básica 
para detectar sitios que son discordantes con 
el grupo como un todo (Hosking y Wallis, 
1997). 


Test de Discordancia (primera prueba) 


Suponiendo que existen N sitios en el grupo 
que se analiza, se define a 4, =[F' KZ £,]" como 
un vector que contiene los cocientes L: t, t, y 
t, de cada sitio 1, definidos por las ecuaciones 
(A.6) a (A.8) del apéndice. El superíndice T 
significa transpuesto, ya que u, es un vector 
renglón. El vector promedio (no ponderado) 
del grupo será (Hosking y Wallis, 1997): 


1 N 
ú= 2% (1) 


La matriz A de suma de cuadrados y de 
productos cruzados estará definida como: 


4-3 (u:-0)(u-8) (2) 


Finalmente, la medida de la Discordancia 
de cada sitio será: 


A” (uu) (3) 


Entonces, cuando D,es mayor que los valores 
críticos (D, cuadro 1), el sitio será discordante 
con el grupo. Una descripción más detallada de 
la prueba se tiene en Campos (2008c). 


Test H de homogeneidad regional (segunda prueba) 


El objetivo es estimar el grado de hetero- 
geneidad en un grupo de sitios y evaluar 


Cuadro 1. Valores críticos (D ) para el estadístico de 
Discordancia (D). 


N D. N D. N D. 
5 | 1333 9 2.329 13 2.869 
6 | 1.648 10 2.491 14 2.971 
7 | 1917 11 2.632 =15 | 3.000 
8 | 2.140 12 2.757 = = 
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cuando éstos pueden ser tratados como una 
región homogénea. Específicamente, la medida 
de heterogeneidad compara las variaciones 
entre sitios en los momentos L muestrales para 
el grupo, con la variación que cabe esperar 
en una región homogénea, la cual tiene igual 
distribución de probabilidades. 

Suponiendo que la región propuesta tiene 
N sitios, cada localidad ¡ tiene una longitud de 
registro de datos Ny momentos L muestrales 
(1) y cociente L-Cv muestral tí (ver apéndice). 
Entonces sus valores regionales ponderados 
serán: 


(5) 


La desviación estándar ponderada de los 
cocientes L-Cv muestrales será: 


Con base en los resultados de la ecuación 
(4) se calculan los cocientes de momentos t, y 
f, regionales, se llevan a la figura 1 y se define 
el mejor modelo probabilístico para simular 
500 regiones homogéneas con N sitios, cada 
uno con 1, longitudes de registro. Estas 
regiones, por lo tanto, no tienen correlación 
cruzada ni serial. Para cada región sintética se 
calcula V (ecuación (6)), determinando al final 
de la simulación su media (u,,) y su desviación 
estándar (0,). Finalmente, la medida de 
heterogeneidad será (Hosking y Wallis, 1997): 


V- 
el ez (7) 
v 

cuando H > 2, la región es definitivamente 
heterogénea; cuando 1 < H<2, la región es 
posiblemente heterogénea, y cuando H < 1, 
la región es aceptablemente homogénea. 
Valores de H cercanos a la unidad sugieren 
redefinir la región y cercanos a dos implican 
su modificación. Los valores negativos de H 
ocurren, indicando que hay menor dispersión 
entre los cocientes L-Cv muestrales de cada 
sitio y la que se debe esperar en una región 
homogénea con distribuciones de probabili- 
dad independientes en cada sitio. Entonces 
ocurre correlación cruzada excesiva o existe 
una regularidad notable en los datos. 

La simulación de las 500 regiones homo- 
géneas se realiza generando números aleatorios 
con distribución uniforme u, en el intervalo 0 
a 1 y considerando tales valores iguales a la 
probabilidad de no excedencia, para estimar 
a través de la solución inversa del modelo 
probabilístico utilizado, el dato sintético que 
se busca. El algoritmo que se usó para generar 
los números aleatorios 1, se detalla en Metcalfe 
(1997). 

Cuando los cocientes de momentos t, y t, 
regionales no definen en la figura 1 de manera 
clara o precisa una FDPidónea, se puede utilizar 
en las simulaciones un modelo probabilístico 
general, como la distribución Wakeby o la 
Kappa (Hosking y Wallis, 1997). 


Test de Wiltshire (tercera prueba) 


Basado en el coeficiente de variación (CV) 
de cada sitio j de la región estudiada, la cual 
incluye N sitios, se define como el cociente 
entre la desviación estándar del sitio y su 
media, es decir: 


Ep 


Cy = (8) 

Designando nuevamente por 1, la longitud 
del registro de datos en el sitio j, se establece 
como u, la variancia muestral del Cv; 
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Distribuciones de dos y tres parámetros de ajuste son mostradas como puntos y líneas, respectivamente 


0.40 


0.35 


0.30 Y 


0.25 1 


0.20 


Cociente L-Ck de asimetría (14) 


0.05 


fu 
0.00 j 
0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 


Cociente L-Cs de asimetría (13) 


Simbología: 

L Logística GLO Logística generalizada 

N Normal GEV General de valores extremos 

U Uniforme LN3 Log-normal de tres parámetros 
G Gumbel GPA Pareto generalizada 

E Exponencial PE3 Pearson tipo III 


OLB Límite inferior de 1, como función de tz 


Figura 1. Diagrama de cocientes de momentos L. 


u;= Te (9) siendo CV, el valor ponderado del CV de la 
y región, es decir: 
donde V, es la variancia regional del CV; N 
se estima con la ecuación (13). La variación Cy! Ú; 
total del CV dentro de la región de N sitios Cv, = E (11) 
se designa por el estadístico S, que tiene 00! 
distribución x? con v= N -1 grados de libertad pl 
(Wiltshire, 1986a): 


La variancia regional V, de la ecuación 
(9) puede ser calculada como el promedio de 
(10) las variancias truncadas calculadas en cada 
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sitio de la región. Entonces, siendo X,, X,»..., X 


5 
los n, datos independientes e idénticamente 
distribuidos de cada sitio, el CV, , será el 
coeficiente de variación calculado de una 
muestra de tamaño n- 1, consistente en los x,, 


ne 


TV Tr” 


¡-ésima observación suprimida. 


y A datos, es decir una serie con la 


Entonces, la estimación de la variancia 
truncada de C V,es la variancia del conjunto de 
2; valores de CV, ,, en los cuales cada valor ha 
sido calculado de las series con una observa- 
ción diferente removida (Wiltshire, 1986b), es 


Finalmente, si S es menor que el valor crítico 
X, la región será homogénea; en caso contrario, 
no homogénea (Wiltshire, 1986a, 1986b; Rao y 
Hamed, 2000). 


Aplicaciones 
Primera aplicación 


Se realizó en la Región Hidrológica Número 


10, utilizando once registros de gastos 


máximos anuales (m*/s) obtenidos en sus 


decir: estaciones de aforos de menor área de cuenca, 
de manera que éstas fluctuaron de 223 a 1 

(n,-1) N ; 1N 2 645 km?. La información hidrométrica se 
A 2 CU 7 4 (12) obtuvo del sistema BANDAS (IMTA, 2003), 


entonces la variancia regional V, a través de los 
N sitios será: 


(13) 


Los valores críticos de y? con un nivel de 
significancia del 5% (95% de confiabilidad) 
para los grados de libertad empleados en los 
ARFC se muestran en el cuadro 2. 


con datos actualizados hasta el año 2002; sus 
características generales se pueden consultar 
en Campos (2008b). La prueba de Discordancia 
no detectó anomalías en los datos. Los 
cocientes de momentos L regionales (cuadro 
3) determinan en la figura 1 como FDP más 
conveniente la log-normal de tres parámetros, 
por ello las simulaciones de la prueba H se 
realizaron con base en la FDP Wakeby ajustada 
por momentos L (Hosking y Wallis, 1997). Los 
resultados de las pruebas H y de Wiltshire 
se tienen en el cuadro 3, indicando que tales 
estaciones forman una región homogénea. 


Cuadro 2. Valores críticos del estadístico y? con o =5%, según el número de grados de libertad (v). 


v E v E v e v Xe 

6 12.6 10 18.3 14 23.7 18 28.9 

7 14.1 11 17 15 2 19 30.1 

8 15.5 12 21.0 16 26.3 20 31.4 

9 16.9 úl) 22.4 17 27.6 21 32.7 
Cuadro 3. Resultados de las pruebas estadísticas de homogeneidad regional (H) o 
y del test de Wiltshire (S) en las cuatro aplicaciones numéricas indicadas. y 
a dle Prueba H Prueba S E 
3 
aplicación pr ER E FDP Vv TA O, H V cv, S Xx 3 
Primera 0.45794 | 0.36860 0.23138 | WAK | 0.06437 | 0.06268 | 0.01624 | 0.104 2.30741 0.95965 | 12.269 | 18.3 E 
Segunda 0.43848 | 0.40435 0.28014 GVE | 0.14439 | 0.04865 | 0.01713 | 5.589 1.46242 0.96523 | 37.269 12.6 3 
Tercera 0.62103 | 0.47540 0.26270 PAG 0.08832 | 0.07090 | 0.01987 | 0.877 2.68344 1.31025 3.260 14.1 5, 
Cuarta 0.23336 | 0.27519 0.20546 GVE | 0.03284 | 0.03243 | 0.00438 | 0.094 0.20320 0.44214 | 30.748 | 47.4 3 
E 
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Segunda aplicación 


En la cuenca del río Guayalejo, que pertenece 
a la Región Hidrológica Número 26 (Pánuco), 
existen diez estaciones hidrométricas, cuyos 
datos de gastos máximos anuales (m?*/s) 
fueron recabados del sistema BANDAS (IMTA, 
2003), con datos hasta el 2002. Con base en 
la prueba de homogeneidad de Langbein 
se encontró que siete de tales hidrométricas 
forman una región homogénea. Los registros 
de estas estaciones se pueden consultar en 
Campos (2006). La aplicación de la prueba 
de Discordancia se muestra en el cuadro 4, 
indicando que ningún registro es discordante 
con el resto, pues no exceden el valor crítico de 
1.917; sin embargo se observa que sus valores 


como distribución idónea la GVE, con la cual 
se efectuó la simulación de las 500 regiones 
homogéneas. Los resultados de la aplicación 
de las pruebas H y de Wiltshire se presentan 
en el cuadro 3, mostrando que la región es no 
homogénea. 


Tercera aplicación 


De acuerdo con el sistema BANDAS (IMTA, 
2003), en la Región Hidrológica Número 25 
(San Fernando-Soto La Marina) existen 14 
estaciones de aforos que realizan muestreo de 
sedimentos, reportado como volumen de só- 
lidos en suspensión anual (miles de m”), algunas 
con datos hasta 1999 y características generales 
que se pueden consultar en Campos (2005). 


de Discordancia son elevados. Con base en Los resultados de la prueba de Discordancia 


los valores de los cocientes de momentos L en las ocho estaciones hidrométricas que 


regionales (cuadro 3) se definió en la figura 1 fueron procesadas como región homogénea se 


Cuadro 4. Valores de los cocientes de momentos y de las discordancias en la cuenca del río Guayalejo, en Tamaulipas. 


Estación de aforos t L, ln D, 
Mante 0.3808 0.3857 0.3882 1.04 
Sabinas 0.2947 0.3102 0.1993 1.16 
La Servilleta 0.3379 0.2650 0.2397 1.30 
La Encantada 0.6139 0.6006 0.4134 1.11 
San Gabriel II 0.6503 0.5638 0.2822 1.15 
Magiscatzin II 0.3941 0.3241 0.1549 0.72 
Tamesí 0.2480 0.2506 0.2238 0.51 
Valor promedio 0.4170 0.3857 0.2716 De=1.917 


Cuadro 5. Valores de los cocientes de momentos y de las discordancias en la 
Región Hidrológica Número 25 (San Fernando-Soto La Marina). 


Estación de aforos É E le D, 
= Padilla II 0.6336 0.4412 0.1659 0.84 
Pl Paso del Aura 0.7121 0.6039 0.3706 1.28 
E Pablillo 0.5201 0.3669 0.1996 0.65 
E El Barretal II 0.7588 0.5628 0.1935 0.90 
h Barberena 0.7438 0.5924 0.2964 0.54 
E Cabezones 0.5908 0.4275 0.1431 11.273) 
< Camacho 0.4927 0.4013 0.3428 1.15 
z Magueyes 0.6054 0.4788 0.3401 0.91 
= Valor promedio 0.6321 0.4843 0.2565 Dc =2.140 


S 
0) 
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exponen en el cuadro 5, indicando que ningún 
registro es anómalo. 

Los cocientes de momentos L regionales 
(cuadro 3) definen en la figura 1 como FDP 
más conveniente la Pareto Generalizada, 
cuyo método de ajuste se describe en 
Hosking y Wallis (1997). Las simulaciones 
de la prueba H se realizaron con este modelo 
y sus resultados, mostrados en el cuadro 3, 
indican que los ocho registros de sedimentos 
procesados forman una región homogénea. 
A igual conclusión se llega con la prueba de 
Wiltshire. 


Cuarta aplicación 


En la zona Huasteca del estado de San Luis 
Potosí, la cual pertenece a la Región Hidroló- 
gica Número 26 (Pánuco), se localizan 34 
estaciones pluviométricas, cuyos registros de 
precipitación máxima diaria anual tomados del 
sistema ERIC 1] (IMTA, 2000) abarcan desde 32 
hasta 40 años, con las características generales 
que se pueden consultar en Campos (2008a). 
La prueba de Discordancia no detecta registros 
anómalos. Los valores regionales de los 
cocientes de momentos L (cuadro 3) conducen 
en la figura 1 a la distribución GVE como la 
más conveniente para realizar las simulaciones 
requeridas en la prueba H. Los resultados de 
esta prueba y del test de Wiltshire se presentan 
en el cuadro 3, los cuales indican que la región 
formada por los 34 registros procesados es 
homogénea. 


Análisis de resultados 


De manera general, los resultados de las tres 
pruebas estadísticas descritas y aplicadas en 
cuatro regiones consideradas originalmente 
como homogéneas son consistentes. Los 
resultados de las pruebas H y del test de 
Wiltshire en la tercera aplicación numérica 
demuestran que la prueba de Langbein 
propuesta por Dalrymple (1960) no es 
confiable, como lo han demostrado Fill y 
Stedinger (1995). 


Conclusiones 


Los resultados de las tres pruebas estadísticas 
descritas, aplicadas en diversas regiones consi- 
deradas originalmente homogéneas, aquí 
descritas únicamente cuatro, de manera general 
son coincidentes y se complementan para 
decidir sobre la homogeneidad de un grupo 
de sitios; por ello se recomienda su aplicación 
sistemática. 

Con respecto a la prueba H, se recomienda 
llevar a cabo las simulaciones de las 500 regiones 
homogéneas con base en la distribución Wakeby 
y la definida en la figura 1 como idónea según 
los cocientes (t, y t,) de momentos L regionales, 
sobre todo cuando el valor del estadístico H 


resultó cercano a la unidad. 
Apéndice. Momentos L muestrales 


Son un sistema alternativo para describir 
las formas de las FDP. Los momentos L son 
combinaciones lineales de los momentos 
de probabilidad pesada desarrollados por 
Greenwood et al. (1979), de manera que 
(Hosking y Wallis, 1997): 


»,=B, (A.1) 
2,=2P, -B, (A.2) 
),=6B,-6'P, + B, (A.3) 
»,=20-B,-30:B,+12-P,-B, (A) 


»,=70:B,— 140:B, + 90-P,—20-B, + B, (A.5) 


Además, se definen los cocientes (t) de 
momentos L, comenzando con L-Cv, que es 
análogo a este coeficiente, y después los de 
similitud con los coeficientes de asimetría y de 
curtosis, que son: 


1=1,/2, (A.6) 


1,=2,/ 2, (A.7) 
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T,=2% 1 A, (A.8) 

En una muestra de tamaño n, con sus 
elementos arreglados en orden ascendente (x, 
< x, < ... < x,), los estimadores insesgados de 
B, son: 


1 n 
by = n2% (A.9) 
1% (¡5-1 
by y (A.10) 
_ 15 (¡-D00-2) 
Lei 22) di (4.11) 


con la expresión general siguiente: 


VR 


j=r+1 


Los estimadores muestrales de A, serán 1, 
estando definidos por las ecuaciones (A.1) a 
(A.5), y los de los cocientes serán t, £, y t,, según 
las ecuaciones (A.6) a (A.8). 
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Campos-Aranda, Verificación de la homogeneidad regional mediante tres pruebas estadísticas 


Abstract 


CAMPOS-ARANDA, D.F. Regional homogeneity verification through three statistical 
tests. Water Technology and Sciences, formerly Hydraulic engineering in Mexico (in 
Spanish). Vol. I, No. 4, October-December, 2010, pp. 157-165. 


First, general concepts about regional flood frequency analysis are presented. Next, the 
Discordancy Test for the detection of records with anomalous data that are discordant with 
the group as a whole is described in detail. Two more tests are presented: the heterogeneity H 
test based on the simulation of 500 homogeneous regions and the Wiltshire Test, which used 
the local and regional coefficient of variation to establish a statistic value with x? distribution. 
Then, the three statistical tests cited are used in four originally accepted homogeneous regions 
and the results are discussed. Lastly, conclusions are formulated, proposing the systematic 
application of the three tests to decide about the homogeneity of the studied region. 


Keywords: L moments, discordancy, simulation, H Test, Wiltshire Test. 
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